智能论文笔记

ACLNet: An Attention and Clustering-based Cloud Segmentation Network

Dhruv Makwana , Subhrajit Nag , Onkar Susladkar , Gayatri Deshmukh , Sai Chandra Teja R , Sparsh Mittal , C Krishna Mohan

分类：计算机视觉 | 人工智能

2022-07-13

我们提出了一种名为ACLNET的新型深度学习模型，用于从地面图像中分割云。ACLNET同时使用深神经网络和机器学习（ML）算法来提取互补功能。具体而言，它使用有效网络-B0作为骨干，“``trous tos blacial pyramid boming''（ASPP）在多个接受场上学习，并从图像中提取细节细节。ACLNET还使用K-均值聚类来更精确地提取云边界。ACLNET对白天和夜间图像都有效。它提供的错误率较低，较高的召回率和更高的F1得分比Art最先进的云分割模型。ACLNET的源代码可在此处获得：https：//github.com/ckmvigil/aclnet。

translated by 谷歌翻译

WaferSegClassNet -- A Light-weight Network for Classification and Segmentation of Semiconductor Wafer Defects

Subhrajit Nag , Dhruv Makwana , Sai Chandra Teja R , Sparsh Mittal , C Krishna Mohan

分类：计算机视觉 | 机器学习

2022-07-03

随着半导体晶片的整合密度和设计的复杂性的增加，它们中缺陷的幅度和复杂性也在上升。由于对晶圆缺陷的手动检查是昂贵的，因此高度需要基于自动的人工智能（AI）计算机视觉方法。先前关于缺陷分析的作品具有多个局限性，例如准确性低以及对分类和分割的单独模型的需求。为了分析混合型缺陷，一些以前的作品需要为每种缺陷类型分别训练一个模型，这是不可估计的。在本文中，我们介绍了基于编码器架构的新型网络WafersegClassnet（WSCN）。 WSCN执行单个和混合型晶圆缺陷的同时分类和分割。 WSCN使用“共享编码器”进行分类和细分，允许训练WSCN端到端。我们使用N-PAIR对比度损失首先预处理编码器，然后使用BCE-DICE损失进行分割，并进行分类的分类横向损失。使用N-PAIR对比度损失有助于更好地嵌入晶圆图的潜在维度。 WSCN的模型大小仅为0.51MB，仅执行0.2m的拖鞋。因此，它比其他最先进的型号轻得多。同样，它仅需要150个时期才能收敛，而先前的工作需要4,000个时代。我们在具有38,015张图像的混合WM38数据集上评估了我们的模型。 WSCN的平均分类精度为98.2％，骰子系数为0.9999。我们是第一个在混合WM38数据集上显示分割结果的人。可以从https://github.com/ckmvigil/wafersegclassnet获得源代码。

translated by 谷歌翻译

GEMv2: Multilingual NLG Benchmarking in a Single Line of Code

Sebastian Gehrmann , Abhik Bhattacharjee , Abinaya Mahendiran , Alex Wang , Alexandros Papangelis , Aman Madaan , Angelina McMillan-Major , Anna Shvets , Ashish Upadhyay , Bingsheng Yao

分类：自然语言处理 | 人工智能 | 机器学习

2022-06-22

通常通过过去的选择来告知机器学习中的评估，例如要使用哪些数据集或指标。该标准化可以使用排行榜对平等基础进行比较，但是随着出现更好的替代方案，评估选择变得不佳。这个问题在自然语言生成中尤其相关，该语言需要不断改善的数据集，指标和人类评估以提出确定性的主张。为了使遵循最佳模型评估实践更加容易，我们介绍了GEMV2。新版本的一代，评估和指标基准为数据集，模型和指标开发人员提供了模块化基础架构，以使彼此受益。GEMV2支持40种记录的数据集中51种语言。所有数据集的模型都可以在线评估，我们的交互式数据卡创建和渲染工具使得在Living Benchmark中添加新数据集变得更加容易。

translated by 谷歌翻译

Content Addressable Memory Without Catastrophic Forgetting by Heteroassociation with a Fixed Scaffold

Sugandha Sharma , Sarthak Chandra , Ila R. Fiete

分类：人工智能 | 机器学习

2022-02-01

所谓的内容，因为可以通过项目的部分或损坏的版本召回了所谓的内容，因为存储的项目显示了几乎完美的召回少数低于容量的信息密集模式和“记忆悬崖”以外，因此插入单个模式会导致所有存储模式的灾难性丧失。我们提出了一种新颖的CAM架构，具有异质关联（网格）的内存支架（网格），它分配了内部吸引力动力学的问题，并与外部内容相关联，以生成无记忆悬崖的凸轮连续性：少量的模式以完整的信息恢复匹配标准存储凸轮同时插入更多模式仍会导致每种模式的部分回忆，并在模式数和模式丰富度之间进行优雅的权衡。网格是由大脑中肠道海马的内存电路的架构激励的，是一种三方结构，具有成对相互作用，使用了一组预定的内部稳定状态，以及内部状态和任意外部模式之间的异性关联。我们通过分析和实验表明，对于任何数量的存储模式，网格几乎可以饱和cam网络的总信息（由突触的数量给出），表现优于所有现有的CAM模型。

translated by 谷歌翻译

ULTRA: A Data-driven Approach for Recommending Team Formation in Response to Proposal Calls

Biplav Srivastava , Tarmo Koppel , Sai Teja Paladi , Siva Likitha Valluru , Rohit Sharma , Owen Bond

分类：人工智能

2022-01-13

We introduce an emerging AI-based approach and prototype system for assisting team formation when researchers respond to calls for proposals from funding agencies. This is an instance of the general problem of building teams when demand opportunities come periodically and potential members may vary over time. The novelties of our approach are that we: (a) extract technical skills needed about researchers and calls from multiple data sources and normalize them using Natural Language Processing (NLP) techniques, (b) build a prototype solution based on matching and teaming based on constraints, (c) describe initial feedback about system from researchers at a University to deploy, and (d) create and publish a dataset that others can use.

translated by 谷歌翻译

NewsClaims: A New Benchmark for Claim Detection from News with Background Knowledge

Revanth Gangi Reddy , Sai Chinthakindi , Zhenhailong Wang , Yi R. Fung , Kathryn S. Conger , Ahmed S. Elsayed , Martha Palmer , Heng Ji

分类：自然语言处理 | 人工智能

2021-12-16

索赔检测和验证对于新闻认识至关重要，并且已成为有前途的技术，以减轻新闻中的错误信息。然而，大多数现有的工作侧重于索赔句子的分析，同时俯瞰关键背景属性，例如索引者，声称对象和连接到索赔的其他知识。在这项工作中，我们提供了新闻本，新的基准，了解新闻领域的知识意识索赔检测。我们重新定义了索赔探测问题，包括提取与索赔相关的附加背景属性，并发布529索赔由103个新闻文章提示。此外，报讯人旨在在新兴场景中索取索赔检测系统，包括不少培训数据的看不见的主题。最后，我们对这款新基准测试提供了对各种零射和及时的基础基准的全面评估。

translated by 谷歌翻译

PESTO: Switching Point based Dynamic and Relative Positional Encoding for Code-Mixed Languages

Mohsin Ali , Kandukuri Sai Teja , Sumanth Manduru , Parth Patwa , Amitava Das

分类：自然语言处理 | 人工智能 | 机器学习

2021-11-12

NLP应用于代码混合（cm）或混合文本的主要势头最近，主要原因是印度，墨西哥，欧洲，美国欧洲地区的多语素社会中的社交媒体通信中语言混合的普遍性。Word Embeddings是今天任何NLP系统的基本构建块，但嵌入CM语言的单词是一个未开发的领域。CM Word Embeddings的主要瓶颈是语言交换机的切换点。由于在所见示例中的高方差，这些位置缺乏在上下文和统计系统中未能模拟这种现象。在本文中，我们介绍了我们对应用基于切换点的位置编码技术进行CM语言的初步观察，特别是HINGISH（HINDI - 英语）。结果仅比SOTA更长，但很明显，位置编码可以为CM文本培训定位敏感语言模型的有效方法。

translated by 谷歌翻译

Improvised Aerial Object Detection approach for YOLOv3 Using Weighted Luminance

Sai Ganesh CS , Aouthithiye Barathwaj SR Y , R. Swethaa S , R. Azhagumurugan

分类：计算机视觉

2021-10-16

遥感是目标获取的图像，而无需与该目标进行物理接触。如今，由于其减少了图像采集期，因此遥感数据被广泛优选。地面目标的遥感更具挑战性，因为各种因素通过卫星采集的不同介质影响光的传播。遥感领域正在实现几种基于卷积神经网络的算法。监督学习是一种机器学习技术，在培训之前，数据根据其课程标记。为了更准确地检测和对目标进行分类，Yolov3，采用了基于边界和锚固框的算法。为了处理穿越大气的光的各种效果，引入了基于灰度的Yolov3配置。为了更好地预测和解决瑞利散射效果，提出了基于RGB的灰度算法。用基于灰度的YOLO3算法对获得的图像进行分析和训练，以进行目标检测。结果表明，基于灰度的方法比传统的Yolov3方法更准确，更有效地感知目标。

translated by 谷歌翻译

A review of machine learning in processing remote sensing data for mineral exploration

Hojat Shirmard , Ehsan Farahbakhsh , R. Dietmar Muller , Rohitash Chandra

分类：机器学习 | 计算机视觉

2021-03-13

近年来，新发现的矿物沉积物数量和不同矿物质需求的增加有LED探索地质学家，寻找在矿物勘探的每个阶段加工不同数据类型的更有效和创新的方法。作为主要步骤，诸如岩性单元，改变类型，结构和指示剂矿物的各种特征被映射以辅助靶向矿床的决策。不同类型的遥感数据集如卫星和空气传播数据，使得可以克服与映射地质特征相关的常见问题。从不同平台获得的遥感数据量的快速增加鼓励科学家培养先进，创新和强大的数据处理方法。机器学习方法可以帮助处理广泛的遥感数据集，并确定诸如反射连续体和感兴趣的特征的组件之间的关系。这些方法在处理频谱和地面真理测量中是稳健的，用于噪声和不确定性。近年来，通过补充与遥感数据集的地质调查进行了许多研究，现在在地球科学研究中突出。本文对一些流行的和最近建立的机器学习方法的实施和适应提供了全面的审查，用于处理不同类型的遥感数据，并调查其用于检测各种矿床类型的应用。我们展示了组合遥感数据和机器学习方法的高能力，以映射对于提供潜在地图至关重要的不同地质特征。此外，我们发现高级方法的范围来处理新一代遥感数据，以创建改进的矿物前景图。

translated by 谷歌翻译

Nudge: Accelerating Overdue Pull Requests Towards Completion

Chandra Maddila , Sai Surya Upadrasta , Chetan Bansal , Nachiappan Nagappan , Georgios Gousios , Arie van Deursen

分类：人工智能 | 机器学习

2020-11-25

拉力请求是当今协作软件开发和代码审核过程的关键部分。但是，当审阅者或作者不积极参与拉动请求时，拉动请求也可以减慢软件开发过程。在这项工作中，我们设计了一项端到端服务，以提醒作者或审阅者与他们的逾期拉动请求互动，以加速逾期拉动请求。首先，我们根据努力估算和机器学习使用模型来预测给定拉的请求的完成时间。其次，我们使用活动检测来滤除可能逾期的拉请请求，但仍在采取足够的动作。最后，我们使用演员身份证来了解拉动请求的阻止者是谁，并推动适当的演员（作者或审稿人）。轻推的主要新颖性是它成功地减少了拉动请求解决时间，同时确保开发人员认为发送的通知在成千上万的存储库中是有用的。在Microsoft使用的147个存储库的随机试验中，Nudge能够将拉的请求分辨率时间减少60％，而与Nudge未发送通知的逾期拉动请求相比，该请求的8,500次拉。此外，收到推动通知的开发人员将这些通知的73％置于正面。我们观察到在Microsoft的8,000个存储库中扩展Nudge的部署时，我们观察到了类似的结果，在整整一年中，Nudge发送了210,000个通知。这表明了Nudge可以扩展到数千个存储库的能力。最后，我们对选择通知的定性分析指示了未来研究的领域，例如在拉动请求和开发人员的可用性中考虑依赖性。

translated by 谷歌翻译